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摘要 : [目的 /意义 ] 复 杂 网 络 的 社团 结构 研究 已 逐渐 成 为 科学 家 借助 文献 数据 开展 科学 结构 研究 的 有 力 
工具 ,社团 划分 效果 的 不 同 对 科学 结构 的 解读 有 着 举足轻重 的 影响 。 本 文 对 混合 网 络 社 团 划分 方法 进行 梳理 ， 
以 期 对 该 领域 的 相关 研究 提供 借鉴 参考 。[ 方 法 /过 程 ] 通过 文献 调研 ,阐明 混合 网 络 的 概念 与 类 型 ,从 网 络 构 
建 或 算法 革新 角度 对 各 类 型 混合 网 络 的 社团 划分 研究 进行 概述 ,也 对 支撑 混合 网 络 社团 划分 的 经 典 算法 进行 
简介 。[ 结果 /结论 ] 通过 系统 地 梳理 总 结 不 同类 型 混合 网 络 的 社团 划分 工作 ,为 后 续 的 网 络 分 析 研 究 提 供 研 
究 的 视角 和 方法 ,同时 揭示 其 在 科学 结构 研究 中 所 面临 的 挑战 与 所 具有 的 现实 意义 ,展望 今后 可 能 进一步 拓展 


而 提 关 研究 方向 。 
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聚 类 分 析 合作 引用 


科学 研究 的 日 益 复 杂 性 与 交叉 性 使 学 科 边 界 变 得 
模 漳 ,进而 使 科学 结构 越 来 越 难 以 被 清晰 地 认识 。 科 
学 结构 是 长 期 形成 的 .固有 的 \ 不 以 人 们 意志 为 转移 的 
蹇 测 存在 ,是 科学 内 在 逻辑 的 外 在 体现 ,反映 在 科学 
的 部 类 结构 .科学 的 学 科 结 构 .科学 的 知识 结构 上 "1! 。 
盛 姨 科学 的 内 在 本 质 是 客观 不 变 的 ,但 其 外 在 体现 却 
随 吕 人 类 对 科学 认 知 的 加 深 而 不 断 演化 。 如 何 有 效 地 
发 更 科学 结构 已 成 为 知识 发 现 研究 的 焦点 问题 ,对 探 
索 笃 科 演 化 .发现 学 科 交 又 渗透 . 挖 气 前 沿 方向 具有 重 
要 价值 。2002 年 社团 (community ) 概念 被 正式 提出 后 ， 
社团 划分 研究 逐渐 受到 关注 ,而 社团 划分 问题 本 质 上 
是 关联 节点 间 的 聚 类 问题 。 近 年 来 ,基于 文献 网 络 ( 如 
合作 网 络 .引文 网 络 等 ) 的 社团 结构 研究 已 成 为 科学 家 
借助 文献 数据 开展 科学 结构 研究 的 有 力 工 具 。 科 学 家 
合作 网 络 的 结构 .引文 网 络 的 结构 等 在 一 定 程度 上 反 
映 的 正 是 科学 的 学 科 结 构 或 知识 结构 。 

例如 ,2002 年 M. Girvan 和 M. 下.J. Newman 首次 提 
出 社团 概念 时 ,就 利用 GN 算法 对 圣 塔 菲 研究 所 1999 
-2000 年 间 科 学 家 的 合作 网 络 的 主 成 分 (118 位 科学 
家 ) 开 展 了 社团 划分 研究 ( 见 图 1) ,将 这 些 科学 家 分 


成 了 4 个 社团 (基于 代理 的 模型 研究 经 济 和 交通 问题 、 
生态 学 的 数学 模型 .统计 物理 .RNA 结构 )。 随 后 ,有 
关 合 作 网 络 的 社团 研究 大 量 涌现 。R. Lambiotte 和 PP. 
Panzarasa 在 2009 年 通过 对 合作 网 络 进 行 社团 划分 , 研 
究 了 科学 合作 模式 是 如 何 促进 知识 创造 和 扩散 的 ; 
L.A. Moliner 等 在 2017 年 研究 了 人 才 管 理 领 域 科学 家 
合作 网 络 社团 的 演化 历程 ” ,丰富 了 人 才 管 理 动力 学 
的 相关 研究 ,提供 了 关于 研究 人 员 之 间 合 作 原 因 与 合 
作 模 式 的 证 据 ;J. Zheng 等 在 2017 年 基于 单 本 期 刊 的 
作者 共 著 网 络 开展 了 社团 的 演化 研究 ,发 现 了 分 析 
合作 者 社团 演化 更 有 效 的 综合 指数 与 生命 周期 策略 ， 
为 通过 合作 网 络 来 动态 观察 学 术 共 同体 的 演化 研究 提 
供 了 新 思路 。 同 时 ,引文 网 络 分 析 的 内 涵 和 方法 也 随 
着 社会 网 络 分 析 方 法 的 发 展 得 以 不 断 丰富 ” ,通过 引 
文 网 络 社 团 分 析 能 够 更 准确 地 揭示 科学 结构 和 发 展 过 
程 ”。 例 如 ,Y，Kajikawa” 等 利用 FN 算法 通过 分 析 
引文 网 络 社团 随时 间 的 变化 情况 来 识别 新 型 研究 领 
域 ,以 拓展 学 科 的 知识 结构 ;陈云 伟 提出 了 一 种 基于 样 
本 加 权 的 引文 网 络 社团 划分 方法 ,以 Louvain 社团 划分 
方法 为 算法 基础 ,将 科学 论文 用 向 量 空间 模型 表示 , 利 
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< 图 1 圣 塔 菲 研究 所 1999 -2000 年 间 271 位 科学 家 
的 合作 网 络 (118 人 ) 社团 划分 
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ee 
用 父 玫 相似 度 方法 计算 相 邻 论文 之 间 的 相似 度 并 作为 
引 彰 边 的 权重 。 然 后 又 进一步 综合 考虑 节点 结构 与 内 


容 相 似 度 对 网 络 进行 重 构 ,社团 划分 结果 十 分 明 
三 s9 。 近 年 来 具有 代表 性 的 工作 是 莱 顿 大 学 L. Walt 
ma N.J.V. Eck 在 2013 年 开发 的 CitNetExplorer 软 
伟 集 成 了 SLM 社团 划分 算法 以 用 于 引文 网 络 的 社团 
Of 究 1。 

> 然而 ,尽管 图 书 情报 领域 的 研究 人 员 对 合 著 网 络 、 
强 尼 网 络 等 开展 了 大 量 的 社团 研究 工作 ,但 多 数 研 究 
针 葬 的 仅 是 单一 节点 类 型 的 网 络 (如 仅 以 作者 或 论文 
为 畦 点 的 同 构 网 络 ) ,存在 分 析 对 象 单 一 ,关联 关系 单 
-3 对 科学 结构 的 揭示 不 精细 .不 完整 等 不 足 。 为 此 ， 
近年 来 有 研究 人 员 开 始 研究 对 具有 多 种 节点 类 型 或 多 
种 关系 的 网 络 进行 社团 划分 ,以 期 提升 科学 结构 分 析 
的 效果 。 
网 络 的 类 型 对 社团 划分 的 效果 及 要 揭示 的 科学 结 
构 会 有 一 定 影响 ,特别 是 混合 网 络 中 不 同类 型 的 对 象 
及 其 之 间 不 同类 型 的 相互 关系 在 揭示 网 络 所 携带 的 丰 
富 语义 方面 存在 更 丰富 的 功能 ,也 可 能 得 到 多 种 不 同 
的 挖掘 结果 '” 。 因 此 ,本 文 以 混合 网 络 社团 划分 研究 
为 出 发 点 ,检索 图 书 情报 领域 国内 外 相关 研究 文献 ,对 
近年 来 有 关 混合 网 络 社团 划分 方法 的 研究 进行 梳理 和 
述评 。 鉴 于 混合 网 络 的 社团 划分 过 程 包含 网 络 构建 和 
社团 划分 算法 两 个 核心 工作 ,而 社团 划分 算法 的 发 展 
相对 较为 成 熟 ,当前 针对 混合 网 络 社团 划分 方法 的 研 
究 工作 ,核心 贡献 多 数 都 是 针对 如 何 构建 有 效 的 混合 
网 络 方面 ,在 社团 实现 方面 多 数 采用 已 有 的 成 熟 算法 ， 
本 文 重点 评述 混合 网 络 的 构建 方法 ,讨论 不 同类 型 混 
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合 网 络 的 社团 划分 效果 ,以 期 揭示 利用 混合 网 络 划分 
方法 研究 科学 结构 及 其 演化 规律 功能 的 发 展 脉络 ,以 
及 今后 相关 研究 可 能 的 发 展 趋势 。 同 时 ,具有 多 节点 
类 型 多 关系 网 络 的 社团 划分 算法 更 具 难度 与 挑战 性 ， 
因此 许多 研究 工作 集中 在 社团 划分 算法 的 推演 上 ,此 
类 研究 也 在 下 文 做 简要 概述 。 最 后 ,对 当前 图 书 情报 
领域 常用 的 社团 划分 算法 进行 简单 总 结 , 供 有 兴趣 开 
展 相关 研究 工作 的 学 者 参考 。 


昆 合 网 络 的 概念 与 类 型 


本 文 定义 的 “混合 网 络 "是 指 含有 多 种 节点 类 型 


或 多 种 关系 的 网 络 , 即 网 络 中 同时 包含 作者 和 论文 两 
种 或 两 种 以 上 类 型 的 节点 ,或 网 络 的 边 涵盖 了 合作 、 引 
用 或 主题 相似 等 两 种 或 两 种 以 上 的 关系 。 根 据 韩 家 炜 
和 B. Taskar 等 对 网 络 的 定义 ,混合 网 络 本 质 上 属于 异 
构 网 络 的 范畴 , 即 多 种 类 型 节点 与 多 种 关系 的 边 所 组 
成 的 网 络 是 异 构 的 “-” 。 但 鉴于 异 构 网 络 的 概念 强 
调 的 是 网 络 结构 层面 的 复杂 性 , 而 本 文 所 分 析 的 多 节 
点 ` 多 关系 集成 在 一 起 所 形成 的 网 络 强调 的 是 功能 的 
丰富 性 ,故而 提出 “混合 网 络 ” 的 概念 ,便于 图 书 情报 
研究 人 员 将 研究 焦点 聚焦 到 功能 提升 上 , 而 不 是 把 网 
络 变 得 更 复杂 。 

通过 与 图 书 情 报 领域 针对 单一 节点 类 型 网 络 ( 如 
引文 网 络 .合作 网 络 ) 社 团 划 分 研究 的 工作 进行 比较 ， 
发 现 按照 网 络 节 点 与 边 的 类 型 可 以 将 混合 网 络 分 为 三 
类 :第 一 类 , 单 类 型 节点 多 关系 网 络 ,如 以 作者 为 单一 
节点 的 网 络 , 同 时 包含 合作 和 引用 两 种 关系 ;第 二 类 ， 
多 类 型 节点 多 关系 网 络 ,如 网 络 中 同时 包含 作者 和 论 
文 两 种 节点 ,同时 包含 合作 和 引用 两 种 关系 ;第 三 类 ， 
多 类 型 节点 单 关系 网 络 ,如 网 络 中 同时 包含 作者 和 论 
文 两 种 节点 ,但 仅 有 引用 一 种 关系 。 

下 文 主要 从 这 三 种 类 型 的 混合 网 络 出 发 ,分 别 对 
其 社团 划分 的 相关 工作 进行 阐述 和 分 析 。 


单 类 型 节点 多 关系 混合 网 络 的 社团 


在 单 类 型 节点 多 关系 网 络 中 ,可 以 通过 节点 间 多 
种 不 同 的 关系 对 网 络 边 的 含义 赋予 更 丰富 的 内 涵 ,再 
进行 聚 类 或 社团 划分 。 当 前 对 选择 哪些 不 同 的 关系 进 
行 结 合 有 两 种 不 同 的 方向 :其 一 是 基于 研究 目的 ,将 节 
点 间 不 同类 型 的 关系 直接 车 加 在 网 络 中 , 即 多 关系 组 
合 (relation combination) ,其 二 是 将 多 种 关系 融合 成 一 
种 新 的 关系 后 再 分 析 人 研究 对 象 的 关系 特征 等 , 即 多 关 


系 融 合 (relation fusion ) 。 
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2.1 多 关系 组 合 方法 

将 多 关系 组 合 方法 应 用 于 学 科 领 域 的 科学 结构 分 
析 中 ,主要 包括 :@D 引 用 关系 与 共 词 关 系 的 组 合 。 最 具 
代表 性 的 工作 是 H. Small 在 1998 年 将 引用 和 共 词 两 
种 关系 组 合 在 一 起 来 揭示 文献 间 的 直接 连接 关系 和 间 
接连 接 关系 ,进而 作为 一 个 涉及 分 层 聚 类 . 聚 类 的 排序 
以 及 公共 坐标 投射 方法 的 框架 ,支撑 科学 结构 地 图 的 
可 视 化 呈现 研究 。 其 他 工作 还 包括 :C. Calero-Medi- 
na 等 在 2008 年 利用 共 词 和 引用 关系 组 合 的 方法 确定 
了 那些 影响 某 领域 一 段 时 间 的 文章 ,通过 将 这 些 文章 
与 某 领域 早期 具有 影响 力 的 传统 研究 联系 起 来 ,分 析 
了 科学 出 版 物 间 知识 的 创造 和 流动 过 程 ,对 后 续 利用 
多 种 方法 结合 的 相关 研究 具有 启 改 作用" ; 侯 跃 芳 等 
在 2007 年 应 用 内 容 词 与 引文 共 引 聚 类 分 析 , 既 揭示 了 
妊娠 糖尿 病 专题 研究 的 发 展现 状 又 验证 了 聚 类 效果 ， 
六 型 合 分 析 方法 应 用 到 专题 研究 开 了 先河 509 ; 张 输 等 
07 年 利用 共 词 分 析 与 文献 的 引用 次 数 相 结合 前 


得 好 了 区 分 新 研究 领域 发 展 的 早期 和 晚期 阶段 的 重要 
性 3 及 要 在 科技 领域 对 学 习 过 程 和 知识 传播 开展 系 
性 观 察 ” ; 陈 伟 等 在 2014 年 以 我 国 "985 ”高校 为 节 
点 车 建 了 合 著 网 络 和 被 引 网 络 , 对 两 种 网 络 的 基本 结 
构 竺 征 、 网 络 关联 性 质 .社团 特征 和 重要 节点 进行 了 联 
合 结 析 ,揭示 了 “985” 高 校 科 研 合作 网 络 的 复杂 性 特征 
和 发 展 趋 势 ” ,为 研究 高 校 间 合作 与 引用 打开 了 新 视 
角 。 

这 些 研 究 均 对 两 种 或 两 种 以 上 的 关系 进行 了 组 合 
使 用 ,可 以 从 不 同 角 度 更 全 面 挖掘 出 研究 对 象 的 特征 ， 
更 有 效 地 揭示 了 科学 结构 及 演化 问题 。 然 而 ,可 选 的 
组 合 很 多 ,为 了 判断 如 何 进 行 有 效 的 组 合 能 实现 最 佳 
的 效果 ,E. Yan 等 "对 图 书 情报 领域 经 常 分 析 的 合作 
网 络 ,主题 网 络 . 引 用 网 络 等 进行 了 相似 度 测量 ,发 现 
主题 网 络 与 合作 网 络 具 有 最 低 的 相似 度 , 共 引 网 络 与 
引文 网 络 具有 较 高 的 相似 度 ,文献 耦合 网 络 与 共 引 网 
络 也 具有 较 高 的 相似 度 , 共 词 网 络 与 主题 网 络 依然 具 
有 较 高 的 相似 度 。 研 究 中 对 具有 和 较 高 相似 度 的 共 引 网 
络 与 引文 网 络 进行 组 合 ,发 现 因为 网 络 相 似 度 较 高 使 
分 析 结 果 类 似 ,对 于 问题 的 全 面 分 析 没 有 太 大 帮助 。 
因此 ,关系 组 合 应 首先 从 基于 引用 与 非 引用 、 基 于 社交 


与 认 知 这 两 个 维度 人 手 , 对 相似 度 较 低 的 网 络 进行 组 
合 以 揭示 更 多 信息 。 
2.2 ”多 关系 融合 方法 

与 多 关系 组 合 方法 不 同 , 多 关系 融合 方法 是 对 多 
种 关系 进行 融合 处 理 ,该 方法 源 于 对 网 页 的 聚 类 或 分 
类 研究 。 按 照 融合 阶段 的 不 同 ,可 分 为 两 种 类 型 :一 种 
是 社团 合并 , 即 分 别 将 不 同 数据 源 进行 聚 类 ,再 通过 一 
定 的 算法 将 不 同 的 聚 类 结果 合并 到 新 的 聚 类 。 另 一 种 
是 核 融合 ,即将 多 源 数据 的 相似 度 矩 阵 或 距离 矩阵 整 
合 为 一 个 新 的 独立 矩阵 ,再 用 相关 算法 进行 聚 类 或 其 
他 多 元 统计 分 析 。 

在 单 类 型 节点 多 关系 混合 网 络 的 聚 类 合并 研究 方 
面 ,X. X. Yin 等 在 2015 年 提出 一 种 叫做 CROSSCLUS 
的 简单 半 监 督 方法 ,该 方法 根据 用 户 选择 的 一 组 与 聚 
类 目标 相关 的 特征 ,对 多 关系 的 对 象 进行 多 次 聚 类 评 
估 呈 3;L. Wei 等 在 2015 年 针对 多 关系 的 数据 使 用 相关 
分 析 方 法 ,将 不 同 聚 类 之 间 的 距离 计算 为 每 个 聚 类 中 
心 点 的 距离 ,并 为 之 赋 权 重 ,保证 了 实体 之 间 聚 类 的 效 
率 与 聚 类 的 精度 ; 丁 志 军 等 在 2017 年 提出 分 部 多 
关系 聚 类 方法 ,是 聚 类 集成 关系 融合 的 典型 研究 。 该 
方法 根据 实体 间 的 不 同 关系 对 实体 进行 聚 类 ,再 根据 
聚 类 结果 对 不 同 关 系 的 重要 性 进行 加 权 赋 值 , 最 后 整 
合 为 单 关 系 网 络 再 进行 聚 类 ,该 方法 经 过 多 组 公开 数 
据 集 的 实验 ,证 明 其 可 以 有 效 地 提升 聚 类 精度 ” 。 以 
上 聚 类 方法 在 效率 与 精度 上 均 有 所 提升 ,对 利用 聚 类 
方法 展示 科学 结构 的 研究 提供 了 更 可 靠 .更 准确 的 方 
法 基础 。 

在 单 类 型 节点 多 关系 混合 网 络 的 核 融合 研究 方 
面 ,近年 来 有 代表 性 的 相关 工作 是 综合 考虑 学 术 论 文 
的 文本 属性 及 链接 属性 的 混合 聚 类 方法 ,如 围绕 W. 
Glanzel 提出 的 综合 引文 看 合 和 文本 相似 度 的 “引文 - 
文本 ”混合 聚 类 算法 “的 一 系列 相关 研究 ,证 明了 
混合 聚 类 方法 比 使 用 单一 的 方法 进行 社团 划分 的 准确 
率 更 高 。 首 先 ,W. Clanzel 等 借鉴 网 页 内 容 与 链接 分 析 
相 结 的 思想 ,将 文献 间 基于 词 的 关系 与 基于 文献 耦合 
的 关系 结合 到 一 起 ,研究 结果 证 明了 这 种 方法 在 揭示 
研究 领域 结构 上 的 有 效 性 “ ;其 次 , 张 琳 等 使 用 基于 
期 刊 交叉 引用 的 聚 类 算法 来 验证 和 改进 基于 期 刊 的 学 
科 分 类 方案 ;再 者 ,W. Glanzel 团队 还 将 期 刊 的 交叉 
引用 同文 本 挖掘 进行 整合 ,验证 并 提高 了 现 有 的 主题 
分 类 方案 ”! 。 此 外 , 王 小 梅 在 近年 来 陆续 发 布 的 系列 
《科学 结构 地 图 》 中 ,也 是 采用 的 W. Glanzel 团队 的 混 
合 聚 类 方法 。 

在 关系 融合 研究 上 ,W. Glanzel 团队 的 研究 主要 集 
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中 在 对 引用 关系 与 文本 这 两 种 互 为 补充 关系 的 信息 挖 
据 上 ,并 没有 涉足 其 他 两 两 独立 关系 的 研究 。 如 代表 
基于 引用 关系 的 引文 网 络 与 基于 社交 认 知 的 合作 网 络 
之 间 的 混合 聚 类 效果 如 何 , 这 是 今后 需要 进一步 研究 
与 探索 的 。 


气 多 关系 混合 网 络 的 社团 


多 类 型 节点 多 关系 的 网 络 是 相 较 于 传统 的 网 络 而 
定义 的 , 即 网 络 中 若 存在 多 种 实体 类 型 与 多 种 关联 关 
系 ,可 以 视 为 异 构 信息 网 络 。 在 图 书 情报 领域 ,文献 信 
息 网 络 就 是 一 种 具有 多 种 实体 类 型 与 关系 的 异 构 信息 
网 络 ,主要 涉及 文章 .期 刊 .作者 和 关键 词 4 类 实体 。 
其 虫 ,文章 与 期 刊 .文章 与 作者 .文章 与 关键 词 都 具有 
关系 。 因 为 信息 在 异 构 节点 与 关系 间 的 流动 不 同 于 同 
梅 阐 络 , 很 多 基于 同 构 网 络 的 分 析 方 法 不 适用 于 异 构 
信 筷 网 络 , 所 以 对 诸如 此 类 的 网 络 聚 类 或 社团 划分 研 
窜 多 集中 于 对 算法 的 推 新 与 改进 上 。 目 前 ,研究 多 类 
型 基点 多 关系 网 络 的 社团 划分 主要 有 三 种 思路 ,分 别 


度量 方法 ,算法 性 能 不 断 在 提升 。 同 时 ,基于 元 路 径 的 
聚 类 方法 也 相继 涌现 ,其 中 PathSelClus 方法 研究 了 
不 同 元 路 径 对 节点 聚 类 效果 的 影响 ,该 方法 在 元 路 径 
选择 等 方面 需要 较 强 的 假设 条 件 ;而 GenClus 算法 
是 一 种 考虑 链接 关系 强度 的 聚 类 方法 ,通过 用 户 指 导 ， 
确定 节点 属性 与 链接 关系 ,并 能 够 自动 学 习 以 构建 不 
同 的 链接 强度 ,使 聚 类 效果 得 到 改善 ; 李 立 基 于 元 路 径 
的 方法 提出 了 一 种 启发 式 的 搜索 与 前 校 策 略 , 有 效 地 
选择 出 与 用 户 指 导 信息 一 致 的 路 径 并 避免 了 宽度 优先 
遍历 搜索 的 信息 缺失 问题 。 在 此 基础 上 , 李 立 对 同 构 
网 络 的 社团 划分 算法 进行 拓展 ,提出 将 关系 抽取 与 元 
路 径 加 权 相 结 合 的 社团 划分 框架 ,并 在 真实 数据 集 上 
验证 了 该 方法 的 有 效 性 与 准确 性 ” ; 王 锐 在 其 研究 中 
也 提出 了 一 种 考虑 权重 的 元 路 径 社 团 划 分 算法 HCD， 
不 仅 有 效 地 划分 出 多 条 元 路 径 的 社团 ,而 且 可 以 探测 
出 重 且 社团 |。 
3.3” 异 构 网 络 同 构 方法 

同 构 网 络 的 社团 划分 算法 相对 成 熟 ,因此 将 异 构 
网 络 降 维 重 构 为 同 构 网 络 也 是 一 种 可 行 的 方法 。 目 


是 基于 排序 的 方法 、 基 于 元 路 径 的 方法 以 及 异 构 网 络 
网 构 方法 。 
3 基于 排序 的 方法 
EJ 将 排序 方法 应 用 于 社团 划分 或 聚 类 中 ,排序 与 聚 
类 过 以 相辅相成 。 最 先 基 于 异 构 信息 网 络 的 排序 聚 类 
算 演 是 RankClus'” ,其 原理 是 对 网 络 中 的 不 同 节点 不 
断 邮 进行 聚 类 与 排序 ,直到 研究 对 象 的 聚 类 明晰 化 ;之 
后 鼎 现 了 许多 相似 的 排序 聚 类 算法 ,如 NetClus 算 
法 BO .ENetClus 算法 .ComClus 算法 器 等 ,其 中 Net- 
Cl 全 算法 主要 是 针对 星 型 结构 的 网 络 , 该 算法 可 以 高 
效 地 产生 聚 类 结果 与 排名 结果 。 赵 焕 对 NetClus 算法 
进行 改进 ,提出 基于 异 构 网 络 的 MAO Netelus 算法 ,对 
Web 服务 系统 的 三 种 对 象 所 构成 的 多 类 型 节点 多 关系 
网 络 进行 聚 类 分 析 , 实 现 对 Web 服务 推荐 的 改进 ”; 
童 浩 等 提出 一 种 针对 异 构 信息 网 络 的 基于 排名 与 协同 
聚 类 的 RankCoClus 算法 ,实验 结果 显示 该 方法 的 聚 类 
性 能 更 优越 ”*。 
3.2 ”基于 元 路 径 的 方法 

基于 元 路 径 的 方法 是 针对 链接 关系 的 方法 ,网 络 
中 的 不 同 链接 传递 着 不 同 的 信息 ,对 聚 类 的 效果 具有 
一 定 的 影响 ,而 异 构 网 络 中 的 不 同 链接 路 径 构成 了 不 
同 的 元 路 径 。 代 表 性 的 方法 是 Y. Sun 等 在 2011 年 提 
出 来 的 PathSim 方法 ,该 方法 是 一 种 基于 元 路 径 的 
相似 性 度量 方法 。 由 于 该 方法 只 是 针对 同类 节点 计算 


前 ,针对 有 异 构 网 络 的 降 维 方法 主要 有 线性 降 维 分 析 
(linear discriminant analysis，LDA ) 、 主 成 分 分 析 (prin- 
cipal component analysis，PCA ) 、 非 负 和 矩 阵 分 解 (non - 
negative matrix factorization ，NMF ) 以 及 主题 模型 (topic 
model ) 等 。 重 构 方 法 主要 是 将 异 构 网 络 重 构 为 二 分 图 
的 方法 。 基 于 以 上 方法 , 王 婷 在 2016 年 提出 一 种 高 效 
快速 的 异 构 网 络 社团 探测 算法 ” ,首先 对 异 构 社交 网 
络 数据 进行 降 维 ,然后 将 异 构 网 络 重 构 为 二 分 图 ,为 了 
在 社团 划分 中 不 使 信息 丢失 ,利用 标签 传播 的 方法 进 
行 社团 划分 ” ,该 方法 具有 一 般 性 ,可 以 推广 应 用 到 
许多 实际 场景 中 。 

典型 的 异 构 信 息 网 络 聚 类 算法 是 基于 元 路 径 的 方 
法 与 基于 排序 的 方法 ,前 者 较 后 者 而 言 ,省 去 了 繁琐 的 
排序 迭代 过 程 ,但 是 却 需 要 用 户 先 验 经 验 的 指导 ,各 有 
利弊 。 异 构 网 络 同 构 方 法 便于 理解 ,但 过 程 较 为 复杂 。 
若 要 观察 领域 复杂 的 异 构 网 络 的 科学 结构 ,在 异 构 网 
络 的 前 期 处 理 中 ,应 用 基于 排序 的 方法 .基于 元 路 径 的 
方法 或 异 构 网 络 同 构 的 方法 是 必要 的 。 


4 ”多 类 型 节点 单 关 系 混合 网 络 的 社团 


划分 

多 类 型 节点 单 关系 网 络 的 特点 是 节点 类 型 呈现 多 
样 性 ,关于 该 类 网 络 的 社团 划分 研究 鲜 少 ,但 可 以 从 网 
络 构建 角度 为 社团 划分 提供 前 期 工作 的 参考 。 若 对 该 


相似 度 , 因 此 随后 又 出 现 了 针对 非 同 类 市 点 的 相似 度 
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类 网 络 进行 社团 划分 或 聚 类 ,需要 理解 节点 类 型 的 含 
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义 。 
4.1 多重 属 性 的 节点 

有 些 网 络 中 的 多 类 型 节点 本 质 是 实体 多 重 属性 的 
体现 。 比 如 合作 网 络 中 ,节点 一 般 是 作者 或 研究 人 员 ， 
并 不 区 分 其 社会 属性 。 但 是 严格 来 说 ,研究 人 员 是 有 
多 重 属性 的 ,包括 文章 属性 (关键 词 .主题 等 ) .特征 属 
性 (年 龄 职称 等 ) 以 及 社会 属性 (学 生 、 教 师 )。 王 炎 
等 利用 专家 学 者 的 不 同属 性 对 专家 学 者 学 术 网 络 进行 
了 理论 与 方法 的 探究 ,基于 多 元 数据 构建 了 专著 专家 
合作 网 络 .专家 主题 网 络 、 专 利 专家 合作 网 络 等 ,更 加 
准确 地 刻画 了 专家 间 的 显 性 与 隐 性 合作 网 络 " ; 雷 雪 
等 根据 作者 贡献 度 ,将 文章 合作 者 区 分 为 第 一 作者 与 
其 他 作者 ,构建 了 基于 两 类 节点 类 型 的 有 向 合作 网 络 ， 
并 与 传统 无 向 合作 网 络 进行 对 比 ,以 探索 更 有 效 的 科 
研 分 析 方 法 ; 谭 宗 颖 等 在 研究 国际 合作 时 ,将 国家 


社团 发 现 效率 偏 低 的 问题 ,V. Blondel 等 ” 于 2008 年 
提出 Louvain 社团 划分 算法 ,R. Rotta 和 A. Noack 在 
2011 年 对 Louvain 算法 进行 了 优化 ,提出 了 Louvain 算 
法 的 多 级 细 分 "”" 。 在 此 基础 上 ,L. Waltman 和 N.J.V. 
Eck 在 2013 年 改良 提出 SLM 算法 ,SLM 的 特点 在 于 允 
许 已 经 被 划分 社团 的 点 重新 进行 社团 划分 。 

关于 这 些 社团 划分 算法 的 详细 介绍 和 比较 研究 ， 
可 以 参考 时 京 晶 ” 、 陈 云 伟 和 张 瑞 红 “” 等 研究 成 果 。 


6 ”讨论 与 展 所 


本 文 梳理 了 用 于 科学 结构 分 析 的 混合 网 络 社团 划 
分 方法 在 图 书 情报 领域 的 最 新 研究 进展 ,发 现 对 于 单 
类 型 节点 多 关系 的 混合 网 络 , 有 两 种 方式 来 对 多 关系 
进行 处 理 , 分 别 是 多 关系 组 合 与 多 关系 融合 。 多 关系 
组 合 较为 简单 ,选择 两 种 或 两 种 以 上 的 分 析 方 法 即 可 


医 济 为 主导 国家 和 其 他 国家 ,构建 了 以 中 国 为 主导 的 
地 国际 合作 网 络 , 并 进行 主题 内 容 分 析 *1。 

CD 多 种 实体 的 节点 

一 有 些 网 络 中 的 多 类 型 节点 本 质 上 是 不 同 实体 的 体 
现 二 王 朋 等 在 研究 校 企 合作 网 络 时 ,构建 了 科研 人 员 
号 纲 米 类 专利 之 间 的 关系 网 络 ,揭示 了 以 清华 大 学 为 
着 讽 产 学 研 纳米 技术 合作 网 络 的 拓扑 结构 ; 马 攀 艳 
等 通 一 步 拓展 研究 对 象 ,利用 中 国 大 学 与 企业 的 专利 
申请 数据 描绘 了 高 校 与 企业 专利 申请 合作 网 络 图 ,并 
进行 了 网 络 特性 的 分 析 , 发 现 中 国 的 产 学 研 合作 具有 
坟 上 升 空间 。 

CC 不 难 发 现 ,多 类 型 节点 单 关系 的 研究 主要 集中 在 
合作 网 络 上 。 目 前 对 构建 多 类 型 节点 单 关系 网 络 并 进 
行 捍 团 划分 的 研究 工作 相对 较 少 ,但 是 该 类 网 络 的 社 
团 划分 或 聚 类 更 有 利于 对 科学 结构 形成 过 程 中 的 继 
承 \ 从 属 关系 进行 清晰 判断 ,也 是 今后 可 能 的 研究 聚焦 
点 


VOD 


5 支撑 混合 网 络 社团 划分 的 算法 简介 


社团 划分 方法 是 研究 复杂 网 络 结构 的 重要 方法 ， 
2002 年 M. Girvan 和 M. E.J. Newman 提出 一 种 分 裂 算 
法 -GN 算法 ,开启 了 社团 研究 的 热潮 。GN 算法 是 
通过 不 断 移 除 介 数 最 高 的 边 而 实现 社团 划分 的 ;从 另 
一 个 划分 角度 , M. E.J. Newman 又 提出 一 种 基于 聚合 
的 贪 焚 算 法 “ ,即将 网 络 中 的 每 个 节点 都 作为 一 个 独 
立 的 团 复 ,在 划分 过 程 中 节点 不 断 地 进行 合并 形成 社 
团 。 随 后 为 了 衡量 社团 划分 结果 的 好 坏 , M. E. J. New- 
man 和 M. Girvan 于 2004 年 提出 模块 度 函 数 Q ”人 
般 认 为 ,Q 值 越 大 ,社团 划分 越 好 。 为 了 解决 大 型 网 络 


实现 关系 组 合 方法 对 问题 的 解决 。 在 选择 分 析 方 法 
时 ,要 有 所 依据 ,需要 对 不 同 组 合 效 果 进 行 科学 评 佑 ， 
最 好 选择 不 同 维度 的 分 析 方法 。 多 关系 融合 方法 主要 
集中 在 混合 网 络 构建 或 社团 划分 算法 的 革新 改进 上 。 
然而 ,关系 的 融合 是 比较 复杂 的 工作 ,选择 哪些 关系 进 
行 融合 以 及 融合 效果 的 判定 ,都 还 需要 开展 研究 进行 

对 于 更 为 复杂 的 多 类 型 节点 多 关系 网 络 ,由 于 节 
点 属性 的 多 样 性 与 关系 的 复杂 性 ,当前 的 研究 工作 相 
对 较 少 。 研 究 重 点 和 难点 包括 探究 多 类 型 节点 多 关系 
网 络 信 息 挖掘 的 原理 与 方法 、 如 何 准 确 构 建 模 拟 现实 
世界 的 模型 以 及 对 多 节点 或 多 关系 重要 性 的 判别 等 。 
其 研究 前 沿 不 仅 局 限于 对 网 络 构建 方法 与 社团 划分 或 
眼 类 的 探索 上 ,还 有 信息 扩散 \ 语 义 搜索 智能 查询 等 。 
由 于 挖掘 异 构 信息 网 络 的 难度 较 大 ,因此 该 类 研究 更 
具 挑 战 性 与 现实 价值 ,也 是 今后 信息 网 络 研究 的 重要 
方向 之 一 。 

在 揭示 科学 结构 方面 ,单一 网 络 的 社团 划分 研究 
已 经 相对 成 熟 ,而 混合 网 络 的 社团 划分 研究 正 处 于 成 
长 阶段 。 对 于 打破 了 传统 单一 网 络 研 究 局 限 的 混合 网 
络 而 言 ,为 后 续 的 网 络 分 析 研 究 提供 了 新 的 视角 和 方 
法 ,并 且 可 以 挖掘 出 隐藏 在 实体 间 不 同 链接 间 的 丰富 
言 息 ,在 理论 和 实践 上 都 是 一 次 全 新 的 提升 和 尝试 。 
同时 ,混合 网 络 的 社团 划分 在 分 析 科学 结构 .描述 知识 
发 展 以 及 分 析 学 科 交 叉 等 方面 仍然 有 许多 值得 探索 的 
问题 。 科 学 研究 是 一 个 复杂 的 系统 ,本 文 讨论 的 数据 
基础 都 是 文献 ,这 仅仅 是 科研 产 出 的 一 部 分 。 科 学 研 
究 还 涉及 到 科技 战略 规划、 项 目 ,资助 等 大 量 的 信息 ， 
这 些 信 息 也 都 是 与 科学 结构 密切 相关 的 。 未 来 的 研究 
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中 ,还 可 以 拓展 数据 基础 ,从 更 加 全 面 的 角度 ,利用 丰 
富 的 数据 类 型 和 关系 类 型 ,充分 理解 和 揭示 科学 结构 。 
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Abstract: [Purpose/significance | The study of community structure of complex networks has gradually become a 


powerful tool for scientists to carry out scientific structure research with literature data. In addition, the different results of 


community discovery play an important role in the interpretation of scientific structure. Therefore, 


this paper sorts out the 


methods of community discovery in hybrid networks, in order to provide reference and expand the ideas for the relevant re- 


searchers in the field. [Method/process| Through literature research, this paper mainly clarifies the concept and types 


of hybrid networks, and summarizes the research on community discovery of various types of hybrid networks from the per- 


spective of network construction or algorithm innovation. Furthermore, 


works community discovery is also introduced. 


the classical algorithm for supporting hybrid net- 


| Result/ conclusion | Through the systematic review of the community dis- 


covery of different types of hybrid networks, it provides a new perspective and method for subsequent network analysis re- 


search, meanwhile reveals the challenges and practical significance of its research in scientific structure. Finally this paper 


also looks forward to relevant research directions that may be further expanded in the future. 


Keywords: hybrid network community discovery 


clustering 


collaboration citation 


141 


